☰
24.5.2 종단간(End-to-End) 학습에서의 WBC: 정책 네트워크(Policy Network)가 토크 대신 최적화 비용 가중치(Cost Weights)를 출력하는 구조
Home
/
인공지능 (Artificial Intelligence, AI)
/
제목: Embodied AI & Modern Control
/
Chapter 24. 전신 제어와 볼록 최적화 (Whole-Body Control & Convex Optimization)
/
24.5 딥러닝과 최적화의 결합: 미분 가능한 최적화
/
24.5.2 종단간(End-to-End) 학습에서의 WBC: 정책 네트워크(Policy Network)가 토크 대신 최적화 비용 가중치(Cost Weights)를 출력하는 구조
24.5.2 종단간(End-to-End) 학습에서의 WBC: 정책 네트워크(Policy Network)가 토크 대신 최적화 비용 가중치(Cost Weights)를 출력하는 구조